指导四轴飞行器学会飞行

定义任务,定义智能体,训练你的智能体!

Criteria Meet Specification

实现智能体

实现智能体的强化学习算法。

训练智能体

实现智能体的训练及学习。

绘制奖励图表

Criteria Meet Specification

阶段奖励的图表

阶段奖励的图表用于展现智能体在一段时间内如何学习的状况。

反馈

Criteria Meet Specification

问题1

提交的项目中注释了’任务’、’奖励’函数,使用奖励函数指导智能体的学习思路清晰。

问题2

提交的项目中,智能体函数有清晰注释。

问题3

提交的项目中,分析了阶段奖励图表。优秀作品能够展示阶段奖励图表中优化的学习路线。作品中需要尝试不同的优化算法设置(如超参数或复杂结构等),来训练并优化算法。

问题4

提交项目中,包含了完成项目后的经验及感悟,说明了将来能够用于优化算法的建议。